Python爬虫开发工程师

置上金融

0.8-1.2 W

佛山

本科 2年经验
Python爬虫开发工程师

0.8-1.2 K

职位描述:

岗位职责:

工作职责:
1.编写大规模分布式网络爬虫(多线程、分布式调度、协议处理);
2.能用系统解决动态网页内容抓取、深度网页内容抓取的关键技术;
3.采用机器学习,信息检索,大规模数据挖掘等工作;
4.负责大数据高性能分布式处理系统的开发
5.数据清洗整理类产品的应用开发、优化;
6.构建和开发在海量数据下多维分析的数据分析平台

职位要求:
1.Python基础扎实,精通SSH等开源框架;
2.熟悉MySql、Oracle、MongoDB一种或多种数据库开发技术,有较好的数据库设计能力;
3.精通网页抓取原理及技术、深度抓取、动态网页技术抓取、浏览器模拟抓取技术,从结构化的和非结构化的数据中获取信息;
4.精通爬虫和反爬技术,精通http底层协议;精通深度抓取、动态网页技术抓取、浏览器模拟抓取技术等;
5.熟悉分布式系统、多线程
6.具有网络爬虫、网页信息抽取、数据挖掘、自然语言处理、信息检索、机器学习、web挖掘等搜索引擎等相关经验优先;
7.计算机等相关专业优先考虑,本科学历,两年及以上经验

职能类别: 软件工程师

关键字: Python 爬虫工程师 Python工程师 scrapy mongodb redis pyspider 数据挖掘 文本分类 分词

企业介绍:

http://www.zhishangjinrong.com/about/置上金融是一家总部位于中国(上海)自贸区的互联网金融服务公司,是目前行业中最安全稳健的产业互联网金融服务平台。 置上金融高管团队主要来自于500强外资银行及国内知名产业互联网企业,对产业发展、互联网技术和金融内在特性有深厚的掌控, 秉承“为您想得更多,为您做得更好”的服务理念,专注于搭建产业筹资与客户投资的互联网金桥, 致力于金融普惠和产业新价值创造,打造中国一流产业互联网金融平台。 置上金融主要战略合作伙伴均为地方政府企业和大型企业集团,置上金融项目基础资产均精选于知名企业各优质产业项目,其中上海国际医学园、成都国际医学城、株洲金山新城、电子科大国家大学科学园、中国女鞋之都、青羊工业总部基地、国色天乡乐园、银川三沙源国际旅游度假区等项目享誉业界,深受政府和社会广泛赞誉。其重点投资的医疗健康、文化旅游、电子信息、产城一体项目等符合国家产业发展方向,有上千亿优质资产作为兑付保证,为置上金融实现金融普惠和产业新价值创造注入了充实的基础保障和强大动力。
  • 公司规模:100-499人人
  • 公司地址:敬业路229号H7栋202室
  • 注册时间:2015-04
  • 注册资本:1000万人民币
  • 经营范围:2015年04月17日-无固定期限 经营范围:金融信息服务(除金融业务),接受金融机构委托从事金融信息技术外包、金融业务流程外包、金融知识流程外包,商务咨询,企业管理咨询,财务咨询,证券咨询、保险咨询,市场信息咨询与调查(不得从事社会调研、社会调查、民意调查、民意测验),企业形象策划,会展服务,电子商务(不得从事金融业务),理财产品研发及技术开发、技术咨询,从事网络技术、计算机科技领域内的技术服务、技术咨询、技术服务、技术转让。